变量选择:在统计学、机器学习或回归建模中,从候选自变量(特征)里挑选出对预测或解释最有用的一部分变量,以提高模型的可解释性、泛化能力,并减少过拟合与冗余。
/ˈvɛriəbəl səˈlɛkʃən/
Variable selection helps reduce overfitting in a regression model.
变量选择有助于减少回归模型的过拟合。
After fitting several models, the team used variable selection based on cross-validation and domain knowledge to identify the most informative predictors.
在拟合了多个模型后,团队结合交叉验证和领域知识做变量选择,以找出信息量最大的预测变量。
variable 源自拉丁语 variabilis(“可改变的、不同的”),强调“会变化的量”;selection 源自拉丁语 selectio(“挑选、筛选”)。合在一起即“把变量筛选出来”的建模步骤与方法统称。